除了在许多视觉任务中实现高性能外,由于模式之间的冗余信息的可用性,多模式模型对单源故障有预期。在本文中,我们研究了多模式神经网络对单个模态上最坏情况(即对抗性)扰动的鲁棒性。我们首先表明,标准的多模式融合模型容易受到单源对手的影响:对任何单个模式的攻击都可以从多个不受干扰的方式中克服正确的信息,并导致模型失败。这种令人惊讶的脆弱性构成了各种多模式任务,因此需要解决方案。在这一发现的激励下,我们提出了一种对抗性强大的融合策略,该策略训练模型以比较来自所有输入源的信息,检测与其他模式相比,在扰动模式中的不一致之处,并且仅允许来自不受干扰的方式的信息通过。我们的方法在单源鲁棒性方面的最先进方法显着提高,在行动识别方面获得了7.8-25.2%的收益,对象检测的19.7-48.2%和1.6-6.7%的情感分析,而没有降低绩效绩效,在不受干扰的(即清洁)数据上。
translated by 谷歌翻译
我们研究马尔可夫决策过程(MDP),其中状态对应于随机生成奖励的因果图。在这个设置中,学习者的目标是通过在每个州的变量上介绍,识别导致高奖励的原子干预措施。概括最近的因果强盗框架,目前的工作开发(简单)后悔最小化对两级因果MDP的保证,每个状态下并行因果图。我们提出了一种算法,实现了一个依赖于困境的实例。我们算法的一个关键特征是它利用凸优化来解决探索问题。我们识别我们遗憾保证基本紧张的课程,实验验证我们的理论结果。
translated by 谷歌翻译